Protein

Browse of TCMCG019C18052 protein

CDS


Accession Number	TCMCG019C18052
gbkey	CDS
Protein Id	XP_022948915.1
Location	join(324514..324879,327098..327324,328707..328774,328897..328971,329170..329519,329684..329752,329960..330048,330737..332902,333020..333097,333276..333387,333860..333937,334042..334092)
Gene	LOC111452430
GeneID	111452430
Organism	Cucurbita moschata

Protein


Length	1242aa
Molecule type	protein
Topology	linear
Data_file_division	PLN
dblink	BioProject:PRJNA418582
db_source	XM_023093147.1
Definition	dentin sialophosphoprotein isoform X1 [Cucurbita moschata]

EGGNOG-MAPPER Annotation


COG_category	S
Description	Occludin homology domain
KEGG_TC	-
KEGG_Module	-
KEGG_Reaction	-
KEGG_rclass	-
BRITE	ko00000 [VIEW IN KEGG] ko04121 [VIEW IN KEGG]
KEGG_ko	ko:K11807 [VIEW IN KEGG]
EC	-
KEGG_Pathway	-
GOs	-

Sequence

CDS:
ATGTATGGCGGCCCATCCAAGCTCGCTCGGGCCGGCGGCGGCGCTGGCCGCGGAGCCAGCGGAAAGCGGCCGCCCTCCTCTTTTCCTCTACCACCTGCTCACCGCCCCTCCGGCCGTCTCTCTCTCGGCGGCGGTGGCGCCGGTTCTGGCGCAAATCCTCGGAATCGAACCTCCACCGCAGCCAAATCCGAAGCCCCTCTATCCGTCGAGGAGAATTTCAGTCTCGTTACCGGTAACAATCCTTTGGCTTTTGCTATGATAATTCGGTTGGCTCCCGACTTGATCGAAGAGATCAAGCGGGTTGAGTCGCTGGGAGGAACTCCGAGAATTAAGTTTGATGCGAATGCCAAGAATTCTAGTGGTAATGTCATTGATGTTGGGGGTAAAGAGTTTAGGTTCACATGGTCACGTGAAGTTGGTGATCTTTGTGACATATACGAAGAACGTAAAAGTGGCGAAGATGGAAGTGGTTTGCTTGTTGAATCAGGCAATGCTTGGAGAAAAGTGAATGTGCAGCGTATCTTGGATGAATCAACTACAAACCATGTTAAGAAGTTGTCTGAGGAAGCTGAACGAAGATCTAAATCTCGCAGAGCTATTGTCTTAGAACCTGGGAATCCATCTATGAAGAATCAAATAAAGCAATTGGCTGCTGCCGAATCTAATCCATGGAGGATGCATTATAAGAATAAGAAAGAGCCTCCATTTAAAAAGCAGAAAAACGAATTGTCTCAAGTTGGGCCTCCAAAATCTACATTTAAGCCTGGCATGTCATCAGTACCTGCTTCCAAGGAGAGGCTATCATCTTCACCTGTTCCATCTCCACCCGAGCAATCTGGTGCTCCAATATCTCAATTCGGATCTGCAAATCCCACTAAGACTCATTGTATTGCAGAAGATATTAAACCTCGACAACCAGCTAAGATTAATGCTGCTGCTAGCAGTGAGAAGGAAATTCCAACCAAAGCCGCAAAAGGAGTTCTGGAAGCACCAGGACAGGAAGTGAATGCCGGAGCTAAACCAACAGATTTGCAAGGAATGTTGTATAATTTACTCTTGGATAACCCCAAGGGGATGAGTTTGAAGGCATTGGAGAAAGCTGTTGGCGATAAAATCCCAAATTCTGTAAAAAAGATTGAGCCAATCATTAAAAAAATTGCAACCTACCAAGCTCCAGGGAGATATTGTTTGAAGTCAGAAGTTGAGTTGGAAGGCTCTAAAAAGCCTTCATCTGAAGGTGAAAGCTCTCCTTTAGTCAGCCATCAACAAACCCCGGTACATGAAGACTTCCATGATCAACCTGTTCCAGAATCGCAATTAGAAGCAAGACATGTCATTGAATTGGAGGAAAAGGTAGAAACCTCTCAAGCAAACAAAGAATCAAATTTCTTGGAGAAAAATGGCATCCAACAGAATTCACCCGATCCTTTTGCTGAGAAAAAAGGCTCTGAAAATAGCGAAGGCCAGGCAGCTAGTTCTTCTGACAATGAAAGTGACAGTGATTCTGAAAGTGATAGTAGTGATAGTGGAAGTGATAGTGGGAACCGTAGTAGGAGTAGAAGTCGAAGCCCCGTGGGTAGTGGGAGTGGGAGTAGCAGTGATAGTGAAAGTGATGCACCTTCTAATAGCAAGGAGGGTTCTGATGAGGATGTGGATATCATGACTAGTGATGATGACAAAGAACCCAAGAATAAATTGCAAGCTTCCGTACAGGGTTTCTCTGCGTCTCCTGCTGCTTGGAAAAGTCCAGATGGTGGGGCTGTGTTGAACATAGACGATGAGAAGGAAGATGGTCACGAATCTGATGCAATTGACATCGAGAAAGATTCTTCTGATGATGAGCCAGAAGCTAAAATTGATGATCGTAGTTTACCTCCTACAGGAGAAGGTGGAAGACCTGTGGAAGAATCAAGATCCTTGTCACCATACCCTGATGAATTCCAAGAGCGCCAAAACTTTATTGGGAGTTTGTTTGAGGACAGGGAAAATACTGTTGTGGAAAGTTCCAGGCATGAACAATCTGACAGCACAGATAGGATATCTAAAGGCAAGTCTAAAAGGAGCTCTGAGTTGGAGTGCTTTGAAGAGAACGCTGTTCATACTAAGAGATTAAAATTAGAAAGCTCATCTCAACAACCTGTTTCTGGTAATTGGGGAGCCCAATTACAGAGTTCTCGCAATTTATCTCCTAGTAAACTCAACAGAGATTCTGCAAGGAACCCTACCAGTCAAGTTACTAATAAAGGTGAGTTGAAGGGCAATTCTGATTTTAGACCAAAAATGGGAAACAAAGAAATAGTTTCAGAAAAAAATTGTTCAGATGTTTCACAAGCAAGTTGGAGGCCCCATGATCAAAGTGGAGTGAGGGCTGTAGATACAGCAGTTAGACCCGACAAGCATGGTGAGAGCATTGGACGTGGCGGTAAACACAGTGAAAAGGGTGGTCATGCTAATGAAAGTTTTCATGCGTATAAAGATAGATTTTATGGAAATGTTGAAAATGAAGGGATGAATGAGAAAAAAGTTTCAAGAAATTCTAGATCTGGTGGTCCAGGAGACAAACAGATACAACCCTGTGACTCCCATCTTAGTAAACCAGGTGACATAGTTGGAAAATTCAAAGATGGCAAAACGTTTTCAAGTTCGCAGATGGGGTACTCACCAAGGGATAATAATAATAGAATTAGTGCCGACAGGTCCCCAGTTAATGGAAAAGGCCGTATTCTCCAAAGAGAGCATTCAGACCTTGAATTAGGTGAACTTCGTGAGCCCTTTCCTGAGGAAGTATTGGGTAAAAAGAAATTTGAAAGAAATAATTCATCGAAACAGTTGGAGAACAAAGGGCACACTTCAGATATCTGGAGTTCAGAGTTAAATAAAGGAAAATCTAATTTGAAGGCTAGTTTAGATAATGGAAAGCGGTCCTCACCCCATATAAGTACCAAGTTTCCAAGCAATCCAGAAGTCTCAAATCAAAAGAAGATTTCAGAACATAAAGTTGAAGATTTGACGAGGGTAAACCACCGGCCTCCGCAGTCTCATCCACAAGGACCACAATATAGTTCAAGAGTAGATCACGTTGAAGTTGAAAAGCCGGTTGATGCAAATGTAAAACCTAATCAAGGGATTGGTCCAGAAAGCTGTGGGGAAAGCAACAGGAAAGCATCTGTTGGCATTTCCCAGCTGCATGATATGAAACGAGAACAGCTTCCCTCAAAAAAAGGAAGTAAAAGACAAGCACCTAATCAAATAACTGAAGTTACTGATGCACTAAAGAACCCGATATCAGCTGAGCATGAAAATAGTGATCTAAAGAGAAGAGATTCTTCTTCAGATGAAAACAGTTGTTCATATTCCAAGTATGAAAAGGACGAGCCAGAGTTGAAGGGAGCAATCAAAGATTTCTCTCAGTACAAGGAATATGTACAGGAGTATCGTGATAAATATGAATGTTACCTGTCCTTGAACAAAATCCTAGAAAGCTACAGGGCTGAGTTCTGCAAACTCGGGAAGGAGCTTGATTCTTCTAGGGGACAAAATTCAGACAAATACTTTAACCTTTTAGAACAGCTGAAAGAATCTTATCGGCTGTGTTCAACGTTGACTCAAATAAAGAGTAATTTGCAGAGGCATAAGAGGTTGAAAAAGATATTCGTTGTTCTCCACGAAGAGCTGAAGCATCTAAAGGAAAGGATTAAAGATTTTGCACAAACTTATGCGAAGGATTGA

Protein:
MYGGPSKLARAGGGAGRGASGKRPPSSFPLPPAHRPSGRLSLGGGGAGSGANPRNRTSTAAKSEAPLSVEENFSLVTGNNPLAFAMIIRLAPDLIEEIKRVESLGGTPRIKFDANAKNSSGNVIDVGGKEFRFTWSREVGDLCDIYEERKSGEDGSGLLVESGNAWRKVNVQRILDESTTNHVKKLSEEAERRSKSRRAIVLEPGNPSMKNQIKQLAAAESNPWRMHYKNKKEPPFKKQKNELSQVGPPKSTFKPGMSSVPASKERLSSSPVPSPPEQSGAPISQFGSANPTKTHCIAEDIKPRQPAKINAAASSEKEIPTKAAKGVLEAPGQEVNAGAKPTDLQGMLYNLLLDNPKGMSLKALEKAVGDKIPNSVKKIEPIIKKIATYQAPGRYCLKSEVELEGSKKPSSEGESSPLVSHQQTPVHEDFHDQPVPESQLEARHVIELEEKVETSQANKESNFLEKNGIQQNSPDPFAEKKGSENSEGQAASSSDNESDSDSESDSSDSGSDSGNRSRSRSRSPVGSGSGSSSDSESDAPSNSKEGSDEDVDIMTSDDDKEPKNKLQASVQGFSASPAAWKSPDGGAVLNIDDEKEDGHESDAIDIEKDSSDDEPEAKIDDRSLPPTGEGGRPVEESRSLSPYPDEFQERQNFIGSLFEDRENTVVESSRHEQSDSTDRISKGKSKRSSELECFEENAVHTKRLKLESSSQQPVSGNWGAQLQSSRNLSPSKLNRDSARNPTSQVTNKGELKGNSDFRPKMGNKEIVSEKNCSDVSQASWRPHDQSGVRAVDTAVRPDKHGESIGRGGKHSEKGGHANESFHAYKDRFYGNVENEGMNEKKVSRNSRSGGPGDKQIQPCDSHLSKPGDIVGKFKDGKTFSSSQMGYSPRDNNNRISADRSPVNGKGRILQREHSDLELGELREPFPEEVLGKKKFERNNSSKQLENKGHTSDIWSSELNKGKSNLKASLDNGKRSSPHISTKFPSNPEVSNQKKISEHKVEDLTRVNHRPPQSHPQGPQYSSRVDHVEVEKPVDANVKPNQGIGPESCGESNRKASVGISQLHDMKREQLPSKKGSKRQAPNQITEVTDALKNPISAEHENSDLKRRDSSSDENSCSYSKYEKDEPELKGAIKDFSQYKEYVQEYRDKYECYLSLNKILESYRAEFCKLGKELDSSRGQNSDKYFNLLEQLKESYRLCSTLTQIKSNLQRHKRLKKIFVVLHEELKHLKERIKDFAQTYAKD

Browse of TCMCG019C18052 protein

CDS

Protein

EGGNOG-MAPPER Annotation

Sequence